import pandas as pd
import os
import matplotlib.pyplot as plt

clientData = pd.read_csv(os.getcwd() + "\\data\\居民客户的用电缴费习惯分析1.csv")
clientsAvgData = pd.read_excel(os.getcwd() + "\\data\\1647848272130494.xlsx")
avgCount = clientsAvgData["用户编号"].count()/100
avgMoney = clientsAvgData["缴费金额（元）"].mean()

client1 = clientData[(clientData["平均缴费金额(元)"] > avgMoney) & (clientData["平均缴费次数(年)"] > avgCount)]

client2 = clientData[(clientData["平均缴费金额(元)"] > avgMoney) & (clientData["平均缴费次数(年)"] < avgCount)]

client3 = clientData[(clientData["平均缴费金额(元)"] < avgMoney) & (clientData["平均缴费次数(年)"] > avgCount)]

client4 = clientData[(clientData["平均缴费金额(元)"] < avgMoney) & (clientData["平均缴费次数(年)"] < avgCount)]

client = pd.DataFrame(0,index = clientData["用户编号"],columns = ['高价值型用户','潜力型用户','大众型用户','低价值型用户'])

for i in clientData['用户编号']:
    if i in client1['用户编号'].values:
        client.loc[i,'高价值型用户'] = 1
    elif i in client2['用户编号'].values:
        client.loc[i,'潜力型用户'] = 1
    elif i in client3['用户编号'].values:
        client.loc[i,'大众型用户'] = 1
    elif i in client4['用户编号'].values:
        client.loc[i,'低价值型用户'] = 1
client.to_csv(os.getcwd() + "\\data\\居民客户的用电缴费习惯分析2.csv")

plt.rc("font",family='MicroSoft YaHei',weight="bold")
plt.figure(figsize = (12,5))
plt.scatter(client1["平均缴费金额(元)"],client1["平均缴费次数(年)"],color='b',marker='o',label='高价值型用户')
plt.scatter(client2["平均缴费金额(元)"],client2["平均缴费次数(年)"],color='g',marker='s',label='潜力型用户')
plt.scatter(client3["平均缴费金额(元)"],client3["平均缴费次数(年)"],color='y',marker='p',label='大众型用户')
plt.scatter(client4["平均缴费金额(元)"],client4["平均缴费次数(年)"],color='r',marker='h',label='低价值型用户')
plt.legend(loc = 'upper right')
plt.xlabel("缴费金额")
plt.ylabel("缴费次数")
plt.show()